home *** CD-ROM | disk | FTP | other *** search
/ Personal Computer World 2009 February / PCWFEB09.iso / Software / Linux / Kubuntu 8.10 / kubuntu-8.10-desktop-i386.iso / casper / filesystem.squashfs / usr / lib / ruby / 1.8 / abbrev.rb next >
Text File  |  2008-09-19  |  3KB  |  103 lines

  1. =begin
  2. #
  3. # Copyright (c) 2001,2003 Akinori MUSHA <knu@iDaemons.org>
  4. #
  5. # All rights reserved.  You can redistribute and/or modify it under
  6. # the same terms as Ruby.
  7. #
  8. # $Idaemons: /home/cvs/rb/abbrev.rb,v 1.2 2001/05/30 09:37:45 knu Exp $
  9. # $RoughId: abbrev.rb,v 1.4 2003/10/14 19:45:42 knu Exp $
  10. # $Id: abbrev.rb 11708 2007-02-12 23:01:19Z shyouhei $
  11. =end
  12.  
  13. # Calculate the set of unique abbreviations for a given set of strings.
  14. #
  15. #   require 'abbrev'
  16. #   require 'pp'
  17. #
  18. #   pp Abbrev::abbrev(['ruby', 'rules']).sort
  19. #
  20. # <i>Generates:</i>
  21. #
  22. #   [["rub", "ruby"],
  23. #    ["ruby", "ruby"],
  24. #    ["rul", "rules"],
  25. #    ["rule", "rules"],
  26. #    ["rules", "rules"]]
  27. #
  28. # Also adds an +abbrev+ method to class +Array+.
  29.  
  30. module Abbrev
  31.  
  32.   # Given a set of strings, calculate the set of unambiguous
  33.   # abbreviations for those strings, and return a hash where the keys
  34.   # are all the possible abbreviations and the values are the full
  35.   # strings. Thus, given input of "car" and "cone", the keys pointing
  36.   # to "car" would be "ca" and "car", while those pointing to "cone"
  37.   # would be "co", "con", and "cone".
  38.   #
  39.   # The optional +pattern+ parameter is a pattern or a string. Only
  40.   # those input strings matching the pattern, or begging the string,
  41.   # are considered for inclusion in the output hash
  42.  
  43.   def abbrev(words, pattern = nil)
  44.     table = {}
  45.     seen = Hash.new(0)
  46.  
  47.     if pattern.is_a?(String)
  48.       pattern = /^#{Regexp.quote(pattern)}/    # regard as a prefix
  49.     end
  50.  
  51.     words.each do |word|
  52.       next if (abbrev = word).empty?
  53.       while (len = abbrev.rindex(/[\w\W]\z/)) > 0
  54.     abbrev = word[0,len]
  55.  
  56.     next if pattern && pattern !~ abbrev
  57.  
  58.     case seen[abbrev] += 1
  59.     when 1
  60.       table[abbrev] = word
  61.     when 2
  62.       table.delete(abbrev)
  63.     else
  64.       break
  65.     end
  66.       end
  67.     end
  68.  
  69.     words.each do |word|
  70.       next if pattern && pattern !~ word
  71.  
  72.       table[word] = word
  73.     end
  74.  
  75.     table
  76.   end
  77.  
  78.   module_function :abbrev
  79. end
  80.  
  81. class Array
  82.   # Calculates the set of unambiguous abbreviations for the strings in
  83.   # +self+. If passed a pattern or a string, only the strings matching
  84.   # the pattern or starting with the string are considered.
  85.   #
  86.   #   %w{ car cone }.abbrev   #=> { "ca" => "car", "car" => "car",
  87.   #                                 "co" => "cone", "con" => cone",
  88.   #                                 "cone" => "cone" }
  89.   def abbrev(pattern = nil)
  90.     Abbrev::abbrev(self, pattern)
  91.   end
  92. end
  93.  
  94. if $0 == __FILE__
  95.   while line = gets
  96.     hash = line.split.abbrev
  97.  
  98.     hash.sort.each do |k, v|
  99.       puts "#{k} => #{v}"
  100.     end
  101.   end
  102. end
  103.